首页> 外文OA文献 >On Longest Repeat Queries Using GPU
【2h】

On Longest Repeat Queries Using GPU

机译:使用GpU进行最长重复查询

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Repeat finding in strings has important applications in subfields such ascomputational biology. The challenge of finding the longest repeats coveringparticular string positions was recently proposed and solved by \.{I}leri etal., using a total of the optimal $O(n)$ time and space, where $n$ is thestring size. However, their solution can only find the \emph{leftmost} longestrepeat for each of the $n$ string position. It is also not known how toparallelize their solution. In this paper, we propose a new solution forlongest repeat finding, which although is theoretically suboptimal in time butis conceptually simpler and works faster and uses less memory space in practicethan the optimal solution. Further, our solution can find \emph{all} longestrepeats of every string position, while still maintaining a faster processingspeed and less memory space usage. Moreover, our solution is\emph{parallelizable} in the shared memory architecture (SMA), enabling it totake advantage of the modern multi-processor computing platforms such as thegeneral-purpose graphics processing units (GPU). We have implemented both thesequential and parallel versions of our solution. Experiments with bothbiological and non-biological data show that our sequential and parallelsolutions are faster than the optimal solution by a factor of 2--3.5 and 6--14,respectively, and use less memory space.
机译:在字符串中重复查找在诸如计算生物学等子领域中具有重要的应用。 \ l {ler}等人最近提出并找到解决最长的重复覆盖特定字符串位置的挑战,使用总的最佳$ O(n)$时间和空间,其中$ n $是字符串大小。但是,他们的解决方案只能为每个$ n $字符串位置找到\ emph {leftmost} longestrepeat。还不知道如何并行化他们的解决方案。在本文中,我们提出了一种用于最长重复发现的新解决方案,该解决方案虽然在理论上在时间上不理想,但在概念上更简单,工作更快,并且在实践中使用的内存空间比最佳解决方案要少。此外,我们的解决方案可以找到每个字符串位置\ emph {all}的最长重复,同时仍保持更快的处理速度和更少的内存空间使用率。此外,我们的解决方案可在共享内存体系结构(SMA)中实现\\ emph {parallelizable},使其能够利用现代多处理器计算平台(例如通用图形处理单元(GPU))的优势。我们已经实现了解决方案的这些后续版本和并行版本。使用生物学和非生物学数据进行的实验表明,我们的顺序和并行解决方案要比最佳解决方案快2到3.5倍和6到14倍,并且使用的内存空间更少。

著录项

  • 作者

    Tian, Yun; Xu, Bojian;

  • 作者单位
  • 年度 2015
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号